﻿<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>VietOCR - Tesseract ಓಸಿಆರ್ ಗಾಗಿ ಜಾವಾ ಜಿಯುಐ ಫ್ರಂಟೆಂಡ್  </title>
</head>
<body>
    <div class="Section1">
        <h2 align="center">VietOCR</h2>
        <h3>ವಿವರಣೆ</h3>
        <p><a href="http://vietocr.sourceforge.net">VietOCR</a> <a href="https://github.com/tesseract-ocr">Tesseract ಒಸಿಆರ್ ಎಂಜಿನ್</a>ಗಾಗಿ ಇರುವ&#13;
ಜಾವಾ GUI ಫ್ರಂಟ್ ಎಂಡ್ ಆಗಿದ್ದು, ಸಾಮಾನ್ಯ ಚಿತ್ರ ಸ್ವರೂಪಗಳಿಗೆ  ಮತ್ತು ಬಹು-ಪುಟ ಚಿತ್ರಗಳಿಗೆ ಅಕ್ಷರ ಗುರುತಿಸುವಿಕೆ &#13;
ಬೆಂಬಲವನ್ನು ಒದಗಿಸುತ್ತದೆ. ಪ್ರೋಗ್ರಾಂ ಪೋಸ್ಟ್‌ಪ್ರೊಸೆಸಿಂಗ್ ಅನ್ನು ಹೊಂದಿದ್ದು ಅದು ಒಸಿಆರ್ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ನಿಯಮಿತವಾಗಿ&#13;
ಎದುರಾಗುವ ದೋಷಗಳನ್ನು ಸರಿಪಡಿಸಲು ಸಹಾಯ ಮಾಡಿ, ಫಲಿತಾಂಶದ ಮೇಲೆ ನಿಖರತೆಯ ದರವನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ.&#13;
ಈ ತಂತ್ರಾಂಶ ಕನ್ಸೋಲ್ ಅಪ್ಲಿಕೇಶನ್‌ನಂತೆ ಕೂಡ ಕಾರ್ಯನಿರ್ವಹಿಸಬಹುದು, ನಿರ್ದೇಶಗಳನ್ನು ಕಮ್ಯಾಂಡ್ ಸಾಲುಗಳಿಂದ&#13;
ಕಾರ್ಯಗತಗೊಳಿಸುವ ಮೂಲಕ.</p>
        <p>ಬ್ಯಾಚ್ ಪ್ರಕ್ರಿಯೆಗೆ ಈಗ ಬೆಂಬಲವಿದೆ. ಪ್ರೋಗ್ರಾಂ ಹೊಸ ಚಿತ್ರ ಫೈಲ್‌ಗಳಿಗಾಗಿ ಫೋಲ್ಡರ್ ಅನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡುತ್ತದೆ&#13;
 , ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಅವುಗಳನ್ನು ಓಸಿಆರ್ ಎಂಜಿನ್ ಮೂಲಕ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುತ್ತದೆ ಮತ್ತು ಗುರುತಿಸುವಿಕೆಯ ಫಲಿತಾಂಶಗಳನ್ನು &#13;
ಔಟ್‌ಪುಟ್ ಫೋಲ್ಡರ್‌ಗೆ ನೀಡುತ್ತದೆ.</p>
        <h3>ಸಿಸ್ಟಂ ಅವಶ್ಯಕತೆಗಳು</h3>
        <p><a href="http://www.oracle.com/technetwork/java/javase/downloads/index.html">ಜಾವಾ ರನ್ ಟೈಮ್&#13;
                ಎನ್ವಿರಾಮೆಂಟ್ 8</a> ಅಥವಾ ನಂತರದ್ದು. On Windows, <a href="https://support.microsoft.com/en-us/help/2977003/the-latest-supported-visual-c-downloads">Microsoft Visual C++ 2015-2019 Redistributable Package</a> is also required.</p>
        <h3>ಅನುಸ್ಥಾಪಿಸುವುದು</h3>
        <p>ಟೆಸ್ಸೆರಾಕ್ಟ್ ವಿಂಡೋಸ್ ಎಕ್ಸಿಕ್ಯೂಟಬಲ್ ಅನ್ನು ಪ್ರೋಗ್ರಾಂನೊಂದಿಗೆ ಸಂಯೋಜಿಸಲಾಗಿದೆ. ಹೆಚ್ಚುವರಿ <a href="https://github.com/tesseract-ocr/tessdata">&#13;
ಟೆಸ್ಸೆರಾಕ್ಟ್ ಭಾಷಾ ಡೇಟಾ ಪ್ಯಾಕ್</a> ಗಳು , ISO639-3 ಸಂಕೇತಗಳ ಹೆಸರಿನಿಂದ ಪ್ರಾರಂಭವಾಗುತ್ತವೆ,&#13;
ಇವನ್ನು <code>tessdata</code> ಉಪ ಡೈರೆಕ್ಟರಿಯಲ್ಲಿ ಇಡಬೇಕು.</p>
        <p>ಲಿನಕ್ಸ್‌ಗಾಗಿ, ಟೆಸ್ಸೆರಾಕ್ಟ್ ಮತ್ತು ಅದರ ಭಾಷಾ ಡೇಟಾ ಪ್ಯಾಕೇಜ್‌ಗಳು ಗ್ರಾಫಿಕ್ಸ್ (universe) ಭಂಡಾರದಲ್ಲಿವೆ.&#13;
 ಅವುಗಳನ್ನು Synaptic ಬಳಸಿ ಅಥವಾ ಈ ಕೆಳಗಿನ ನಿರ್ದೇಶದ ಮೂಲಕ ಅನುಸ್ಥಾಪಿಸಬಹುದು:</p>
        <blockquote>
            <p><code>sudo apt-get install tesseract-ocr tesseract-ocr-eng tesseract-ocr-vie</code></p>
        </blockquote>
        <p>ಕಡತಗಳು ಕ್ರಮವಾಗಿ <code>/usr/bin</code> ಮತ್ತು <code>/usr/share/tesseract-ocr/tessdata</code>, ನಲ್ಲಿ ಇರುತ್ತವೆ. 
ಹಾಂ! ಒಂದು ವೇಳೆ ನೀವು ಟೆಸೆರಾಕ್ಟನ್ನು  <a href="https://github.com/tesseract-ocr/tesseract/wiki">source</a> ನಿಂದ ಬಿಲ್ಡ್ ಮಾಡಿ ಇನ್ಸಟಾಲ್ ಮಾಡಿದ್ದರೆ, 
ಕಡತಗಳು <code>/usr/local/bin</code> ಮತ್ತು <code>/usr/local/share/tessdata</code> ಗಳಲ್ಲಿ ಇರುತ್ತವೆ. 
ಇಲ್ಲವೇ,
<code>tessdata</code>  ಅನ್ನು  ಎನ್ವಿರಾನ್ಮೆಂಟ್ ವೇರಿಯಬಲ್ ಸೆಟ್   <code>TESSDATA_PREFIX</code> ಮೂಲಕ VietOCR ಗೆ
ಎಲ್ಲಿದೆ ಎಂಬುದನ್ನು ತಿಳಿಸಬಹುದು:</p>
        <blockquote>
            <p><code>export TESSDATA_PREFIX=/usr/local/share/</code></p>
        </blockquote>
        <p>ಇತರ ಪ್ಲ್ಯಾಟ್‌ಫಾರ್ಮ್‌ಗಳಿಗಾಗಿ, ದಯವಿಟ್ಟು <a href="https://github.com/tesseract-ocr/tesseract/wiki">
ಟೆಸ್ಸೆರಾಕ್ಟ್ ವಿಕಿ</a> ಪುಟವನ್ನು ಸಂಪರ್ಕಿಸಿ.</p>
        <p> VietOCR, ನಿಮಗೆ ಬೇಕಿರುವ ಲ್ಯಾಂಗ್ವೇಜ್ ಪ್ಯಾಕನ್ನು ಡೌನ್ಲೋಡ್ ಮಾಡಿ ಇನ್ಸಟಾಲ್ ಮಾಡುವ ಸವಲತ್ತನ್ನು <em>Download Language Data</em> ಮೂಲಕ ನೀಡುತ್ತದೆ. <code>tessdata</code> ಒಂದು ವೇಳೆ ಸಿಸ್ಟಮ್ ಫೋಲ್ಡರಿನಲ್ಲಿ ಇದ್ದರೆ, ನೀವು ರೂಟ್ ಇಲ್ಲವೇ ಅಡ್ಮಿನ್ ಆಗಿ ಡೌನ್ಲೋಡ್ ಮಾಡಿಕೊಂಡ ಡೇಟಾವನ್ನು ಇನ್ಸಟಾಲ್ ಮಾಡಬೇಕಾಗಬಹುದು,  ಉದಾ: ಲಿನಕ್ಸಿನಲ್ಲಾದರೆ <code>/usr</code> ಅಥವಾ ವಿಂಡೋಸಿನಲ್ಲಾದರೆ <code>C:\Program Files</code>.</p>
        <p>ವಿಂಡೋಸ್‌ನಲ್ಲಿ ಸ್ಕ್ಯಾನಿಂಗ್ ಬೆಂಬಲವನ್ನು ಈ ವಿಂಡೋಸ್ ಇಮೇಜ್ ಮೂಲಕ ನೀಡಲಾಗಿದೆ&#13;
			Acquisition Library v2.0.</p>
        <p>ಲಿನಕ್ಸ್‌ನಲ್ಲಿ, ಸ್ಕ್ಯಾನಿಂಗ್‌ಗೆ SANE ಪ್ಯಾಕೇಜ್‌ಗಳ ಸ್ಥಾಪನೆಯ ಅಗತ್ಯವಿದೆ:</p>
        <blockquote>
            <p><code>sudo apt-get install libsane sane sane-utils libsane-extras xsane</code></p>
        </blockquote>
        <p>PDF ಬೆಂಬಲ <a href="http://www.ghostscript.com/">GPL Ghostscript</a> ಮೂಲಕ ಸಾಧ್ಯವಿದೆ.</p>
        <p>ಕಾಗುಣಿತ ಪರಿಶೀಲನೆ ಕಾರ್ಯವು Hunspell ಮೂಲಕ ಲಭ್ಯವಿದೆ, ಇದರ <a href="http://wiki.services.openoffice.org/wiki/Dictionaries">&#13;
                ನಿಘಂಟು</a> ಕಡತಗಳನ್ನು (<code>.aff</code>, <code>.dic</code>) &#13;
             <code>dict</code> ಎಂಬ VietOCR ಫೋಲ್ಡರ್ ನಲ್ಲಿ ಇರಿಸಬೇಕು . <code>user.dic</code> UTF-8-encoded&#13;
            ಕಡತವಾಗಿದ್ದು ಅಗತ್ಯಾನುಗುಣಗೊಳಿಸಿದ ಪದಗಳ ಪಟ್ಟಿಯನ್ನು, ಸಾಲಿಗೊಂದು ಪದದಂತೆ ಹೊಂದಿರುತ್ತದೆ.</p>
        <p>ಲಿನಕ್ಸ್ ನಲ್ಲಿ, Hunspell ಮತ್ತು ಅದರ ನಿಘಂಟುಗಳನ್ನು Synaptic ಅಥವಾ <code>apt</code> ಮೂಲಕ ಅನುಸ್ಥಾಪಿಸಬಹುದು,&#13;
 ಈ ಕೆಳಕಂಡಂತೆ:</p>
        <blockquote><code>sudo apt-get install hunspell hunspell-en-us</code></blockquote>
        <h3>ಸೂಚನೆಗಳು</h3>
        <p>ಕಾರ್ಯಕ್ರಮವನ್ನು ಪ್ರಾರಂಭಿಸಲು:</p>
        <blockquote>
            <p><code>java -jar VietOCR.jar</code></p>
        </blockquote>
        <p><b><u>ಸೂಚನೆ</u></b>: ನಿಮಗೆ out-of-memory exception  ದೋಷ ಎದುರಾದರೆ,<code>ocr</code> ಸ್ಕ್ರಿಪ್ಟ್ ಫೈಲ್ ಅನ್ನು&#13;
.jar ಬಳಸುವ ಬದಲು ಚಲಾಯಿಸಿ.</p>
        <p>ಕನ್ನಡ ಭಾಷಾ ದತ್ತಾಂಶವನ್ನು ನೋಟೋ ಸ್ಯಾನ್ಸ್ ಹಾಗೂ ಇತರೆ ಓಪನ್ ಫಾಂಟ್ಸ್ ಗಳನ್ನು ಬಳಸಿ ಸೃಷ್ಟಿಸಲಾಗಿದೆ.
 ಆದ್ದರಿಂದ, ಆಯಾ ಫಾಂಟ್ ಗ್ಲಿಪ್‍ಗಳಿರುವ ಚಿತ್ರಗಳಲ್ಲಿ ಅಕ್ಷರಗಳ ಗುರುತಿಸುವಿಕೆಯ ಯಶಸ್ಸಿನ ಪ್ರಮಾಣ ಹೆಚ್ಚಿರುತ್ತದೆ. 
ಬೆಂಬಲಿತ ಫಾಂಟುಗಳಗಿಂತ ಭಿನ್ನವಾದ ಫಾಂಟ್ ಗ್ಲಿಪ್‍ಗರುವ ಚಿತ್ರಗಳನ್ನು ಓಸಿಆರ್ ಮಾಡುವಾಗ 
ಅದಕ್ಕೆಂದೇ ಟೆಸರಾಕ್ಟ್ ಅನ್ನು <a href="https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract">training</a> ಗೊಳಿಸಿ ಇನ್ನೊಂದು ಲ್ಯಾಂಗ್ವೇಜ್ ಡೇಟಾ ಪ್ಯಾಕ್ ಅನ್ನು 
ಈ ಟೈಪ್ ಫೇಸ್‍ಗಳಿಗೆ ಸೃಷ್ಟಿಸಬೇಕಾಗುತ್ತದೆ. ಟೆಸರಾಕ್ಟ್ ಹೊಸ ಆವೃತ್ತಿಯಲ್ಲಿ ೨೦ಕ್ಕೂ ಹೆಚ್ಚು ಫಾಂಟ್‍ಗಳನ್ನು 
ಬಳಸಿ ಕನ್ನಡ ಲ್ಯಾಂಗ್ವೇಜ್ ಪ್ಯಾಕ್ ಸೃಷ್ಟಿಸಿರುವುದಾಗಿ ಹೇಳುತ್ತದೆ.</p>
        <p>ಓಸಿಅರ್ ಮಾಡಬೇಕಿರುವ ಚಿತ್ರಗಳನ್ನು ಕನಿಷ್ಠ 200 ಡಿಪಿಐ (ಡಾಟ್ ಪರ್ ಇಂಚ್) ನಿಂದ 400 ಡಿಪಿಐ ರೆಸಲ್ಯೂಷನ್‍ನಲ್ಲಿ 
ಮೋನೋಕ್ರೋಮ್ (ಕಪ್ಪು&amp;ಬಿಳುಪು) ಅಥವಾ ಗ್ರೇಸ್ಕೇಲ್ ಆಗಿ ಸ್ಕ್ಯಾನ್ ಮಾಡಬೇಕು. ಹೆಚ್ಚಿನ ರೆಸಲ್ಯೂಷನ್‍ನಲ್ಲಿ ಸ್ಕ್ಯಾನ್ ಮಾಡುವುದು ಉತ್ತಮ 
ಗುಣಮಟ್ಟದ ಫಲಿತಾಂಶವನ್ನು ನೀಡಬೇಕೆಂದೇನಿಲ್ಲ, ಸಧ್ಯಕ್ಕೆ 
97% ಕ್ಕಿಂತ ಹೆಚ್ಚಿಗೆ ವಿಯೆಟ್ನಾಮೀಸ್‍ಗೆ, ಮತ್ತು ಮುಂದಿನ ಟೆಸರಾಕ್ಟ್ ಆವೃತ್ತಿ ಇದನ್ನು ಇನ್ನೂ ಹೆಚ್ಚಿನ ಮಟ್ಟಕ್ಕೆ ಉತ್ತಮಗೊಳಿಸಬಹುದು.
 ಆದ್ಯಾಗ್ಯೂ ಸಹ, ನಿಜವಾದ ದರಗಳು ಇನ್ನೂ ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಚಿತ್ರದ ಗುಣಮಟ್ಟವನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ. 
ಸ್ಕ್ಯಾನಿಂಗ್‌ನ ವಿಶಿಷ್ಟ ಸೆಟ್ಟಿಂಗ್‌ಗಳು 300 ಡಿಪಿಐ ಮತ್ತು 1 ಬಿಪಿಪಿ (ಬಿಟ್ ಪರ್ ಪಿಕ್ಸೆಲ್) ಕಪ್ಪು&amp;ಬಿಳುವು ಅಥವಾ 
8 ಬಿಪಿಪಿ ಗ್ರೇಸ್ಕೇಲ್ ಸಂಕ್ಷೇಪಿಸದ TIFF ಅಥವಾ PNG ಸ್ವರೂಪ.</p>
        <p><em>ಸ್ಕ್ರೀನ್‌ಶಾಟ್ ಮೋಡ್</em> ಕಡಿಮೆ-ರೆಸಲ್ಯೂಶನ್‌ ಚಿತ್ರಗಳಿಗೆ ಉತ್ತಮ ಗುರುತಿಸುವಿಕೆ ದರವನ್ನು ನೀಡುತ್ತದೆ&#13;
ಸ್ಕ್ರೀನ್ ಪ್ರಿಂಟ್‌ಗಳಂತಹ ಚಿತ್ರಗಳನ್ನು, 300 ಡಿಪಿಐಗೆ ಮರುಹೊಂದಿಸುವ ಮೂಲಕ.</p>
        <p>ಅಂತರ್ನಿರ್ಮಿತ ಪಠ್ಯ ಪೋಸ್ಟ್‌ಪ್ರೊಸೆಸಿಂಗ್ ಅಲ್ಗಾರಿದಮ್ ಜೊತೆಗೆ, ನೀವು ನಿಮ್ಮದೇ ಆದ&#13;
 ಅಗತ್ಯಾನುಗುಣಗೊಳಿಸಿದ ಪಠ್ಯ ಬದಲಿ ಯೋಜನೆಯನ್ನು <code>x‍.DangAmbigs.txt</code>, ಹೆಸರಿನ UTF-8-encoded tab-delimited ಪಠ್ಯ ಕಡತದ ಮೂಲಕ ಸೇರಿಸಬಹುದು&#13;
 ಇಲ್ಲಿ x ಎಂಬುದು ISO639-3 ಭಾಷಾ ಸಂಕೇತವಾಗಿದೆ. ಸರಳ ಮತ್ತು ರೆಜೆಕ್ಸ್ ಪಠ್ಯ ಬದಲಾವಣೆಗಳನ್ನು ಇದು ಬೆಂಬಲಿಸುತ್ತದೆ.</p>
        <p>ನೀವು init-only ಮತ್ತು non-init ನಿಯಂತ್ರಣ ಪ್ಯಾರಮೀಟರ್ಗಗಳನ್ನು ಕ್ರಮವಾಗಿ <code>tessdata/configs/tess_configs</code>&#13;
ಹಾಗೂ <code>tess_configvars</code> ಕಡತಗಳಲ್ಲಿ, Tesseract&#39;s ನಡವಳಿಕೆಯನ್ನು&#13;
ಬದಲಾಯಿಸಲು ಸೇರಿಸಬಹುದು.</p>
        <p>ಕೆಲವು ಅಂತರ್ನಿರ್ಮಿತ ಸಾಧನಗಳನ್ನು ಒಸಿಆರ್ ಕಾರ್ಯಾಚರಣೆಗಳಿಗಾಗಿ ಅನುಕೂಲಕರವಾಗುವಂತೆ&#13;
 ಹಲವಾರು ಚಿತ್ರಗಳನ್ನು ಅಥವಾ ಪಿಡಿಎಫ್ ಕಡತಗಳನ್ನು ಒಂದು ಕಡತದಲ್ಲಿ ವಿಲೀನಗೊಳಿಸಲು, ಅಥವಾ TIFF ಅಥವಾ ಪಿಡಿಎಫ್ ಕಡತಗಳನ್ನು &#13;
ಹಲವಾರು ಪುಟಗಳನ್ನು ಹೊಂದಿದ್ದರೆ ಸಣ್ಣದಾಗಿ ವಿಭಜಿಸಲು ಒದಗಿಸಲಾಗಿದೆ, ಇವು out-of-memory exception ಗಳಿಗೆ ಕಾರಣವಾಗಬಹುದು.</p>
        <h3>ಸಂಸ್ಕರಣೆಯ ನಂತರದ ಹಂತ</h3>
        <p>ಗುರುತಿಸುವಿಕೆ ದೋಷಗಳನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಮೂರು ವರ್ಗಗಳಾಗಿ ವಿಂಗಡಿಸಬಹುದು. ಬಹಳಷ್ಟು
ದೋಷಗಳು ಅಕ್ಷರ ಪ್ರಕರಣಗಳಿಗೆ ಸಂಬಂಧಿಸಿವೆ - ಉದಾಹರಣೆಗೆ: hOa, nhắC - ಇವನ್ನು ಸುಲಭವಾಗಿ
ಜನಪ್ರಿಯ ಯೂನಿಕೋಡ್ ಪಠ್ಯ ಸಂಪಾದಕಗಳಿಂದ ಸುಲಭವಾಗಿ ಸರಿಪಡಿಸಬಹುದು. ಇತರೆ ದೋಷಗಳು ಒಸಿಆರ್ ಪ್ರಕ್ರಿಯೆಯ 
ಫಲಿತಾಂಶವಾಗಿದ್ದು, ಕಾಣೆಯಾದ ಡಯಾಕ್ರಿಟಿಕಲ್ ಗುರುತುಗಳು, ಒಂದೇ ರೀತಿಯ ಆಕಾರಗಳಲ್ಲಿನ ತಪ್ಪು ಅಕ್ಷರಗಳು ಇತ್ಯಾದಿ ಇವುಗಳಲ್ಲಿ ಸೇರಿವೆ
 huu – hưu, mang – marg, h0a – hoa, la – 1a, uhìu - nhìn. ಇವು ಇವನ್ನು
 ಕಾಗುಣಿತ ಪರೀಕ್ಷಕ ಕಾರ್ಯಕ್ರಮಗಳಿಂದ ಸುಲಭವಾಗಿ ಸರಿಪಡಿಸಬಹುದು. ಅಂತರ್ನಿರ್ಮಿತ ಪೋಸ್ಟ್‌ಪ್ರೊಸೆಸಿಂಗ್ ಕ್ರಿಯೆ
ಮೇಲೆ ತಿಳಿಸಿದ ಹಲವು ದೋಷಗಳನ್ನು ಸರಿಪಡಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.</p>
        <p>ದೋಷಗಳ ಕೊನೆಯ ವರ್ಗವನ್ನು ಕಂಡುಹಿಡಿಯುವುದು ಅತ್ಯಂತ ಕಷ್ಟ, ಏಕೆಂದರೆ ಅವು ಶಬ್ದಾರ್ಥದ&#13;
ದೋಷಗಳು, ಇದರರ್ಥ ಪದಗಳು ನಿಘಂಟಿನಲ್ಲಿ ಮಾನ್ಯವಾಗಿದ್ದರೂ ಬಳಕೆಯ ಸನ್ನಿವೇಶದಲ್ಲಿ ತಪ್ಪಾಗಿ&#13;
ಬಳಸಲಾಗಿರುವುದು - ಉದಾ., tinh – tình, vân – vấn. ಈ ದೋಷಗಳನ್ನು ಓದಿ ಮತ್ತು&#13;
ಮೂಲ ಚಿತ್ರದ ಪ್ರಕಾರ ಅವುಗಳನ್ನು ಸರಿಪಡಿಸಲು ಸಂಪಾದಕರ ಅಗತ್ಯವಿದೆ.</p>
        <p>ಒಸಿಆರ್ ದೋಷಗಳ ಮೊದಲ ಎರಡು ವರ್ಗಗಳನ್ನು ಹೇಗೆ ಸರಿಪಡಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಸೂಚನೆಗಳು ಈ ಕೆಳಗಿನಂತಿವೆ&#13;
ಅಂತರ್ನಿರ್ಮಿತ ಕ್ರಿಯಾತ್ಮಕತೆ ಬಳಸುವುದು:</p>
        <ol style="margin-top: 0in" start="1" type="1">
<li>ಗುಂಪು ಸಾಲುಗಳು. ಸಾಲುಗಳನ್ನು ಅವು ಸೇರಿರುವ ಪ್ಯಾರಾಗ್ರಾಫ್‌ಗೆ ವರ್ಗೀಕರಿಸಬೇಕು,&#13;
 OCR ಆದಂತೆ, ಪ್ರತಿ ಸಾಲು ಪ್ರತ್ಯೇಕ 1-ಸಾಲಿನ ಪ್ಯಾರಾಗ್ರಾಫ್ ಆಗುತ್ತದೆ. <i>ಲೈನ್ ಬ್ರೇಕ್ಸ್ ಗಳನ್ನು ತೆಗೆ</i> ಕ್ರಿಯೆಯನ್ನು&#13;
 <i>ಶೈಲಿ</i> ಮೆನು ಅಡಿಯಲ್ಲಿ ಬಳಸಿ. ಈ ಕಾರ್ಯಾಚರಣೆಯು ಕವನಗಳಿಗೆ ಅಗತ್ಯವಿಲ್ಲದಿರಬಹುದು ಎಂಬುದನ್ನು&#13;
 ಗಮನಿಸಿ.</li>
            <li>
<i>ಅಕ್ಷರ ಶೈಲಿ ಬದಲಾವಣೆ</i>, ಹಾಗೂ <i>ಶೈಲಿ</i> ಮೆನು ಕೆಳಗೆ, ಮತ್ತೆ <i>ಸಾಲಿನ&#13;
ಶೈಲಿ</i>  ಆಯ್ಕೆ ಮಾಡಿ ಅಕ್ಷರ ಶೈಲಿಯ ದೋಷಗಳನ್ನು ಸರಿಪಡಿಸಬಹುದು. ಉಳಿದ ಅಕ್ಷರ ಶೈಲಿ ದೋಷಗಳನ್ನು ಹುಡುಕಿ &#13;
ಸರಿಪಡಿಸಬಹುದು</li>
            <li>ಸಂಯೋಜಿತ <i>ಸ್ಪೆಲ್ ಚೆಕ್ ಪರಿಶೀಲನೆಯನ್ನು ಬಳಸಿಕೊಂಡು</i>  ತಪ್ಪಾಗಿ ಬರೆಯಲಾದ ದೋಷಗಳನ್ನು ಸರಿಪಡಿಸಿ.</li>
        </ol>
<p>ಮೇಲಿನ ಪ್ರಕ್ರಿಯೆಯ ಮೂಲಕ, ಹೆಚ್ಚಿನ ಸಾಮಾನ್ಯ ದೋಷಗಳನ್ನು ತೆಗೆದುಹಾಕಬಹುದು. ಉಳಿದ,&#13;
 ಶಬ್ದಾರ್ಥದ ದೋಷಗಳು ಕಡಿಮೆ, ಆದರೆ ಅದನ್ನು ಓದಲು ಮತ್ತು ಅಗತ್ಯ ಸಂಪಾದನೆಗಳನ್ನು ಮಾಡಿ&#13;
ಡಾಕ್ಯುಮೆಂಟ್ ಅನ್ನು ಮೂಲ ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಡಾಕ್ಯುಮೆಂಟ್ ನಂತೆ ಮಾಡಲು, ಮತ್ತು ದೋಷ-ಮುಕ್ತವಾಗಿ ಮಾಡಲು ಇಚ್ಛೆಪಟ್ಟರೆ ಅಗತ್ಯವಾದ ಸಂಪಾದನೆಗಳಿಗೆ ಮಾನವ ಸಂಪಾದಕನ&#13;
 ಅಗತ್ಯವಿದೆ.</p>
        <p>ಯಾವುದೇ ಪ್ರಶ್ನೆಗಳಿದ್ದರೆ, ದಯವಿಟ್ಟು <a href="http://sourceforge.net/projects/vietocr/forums">&#13;
ವಿಯಾಟೊಸಿಆರ್ ಫೋರಮ್ ನಲ್ಲಿ ಪೋಸ್ಟ್ ಮಾಡಿ</a>.</p>
        <hr>
</div>
</body>
</html>
